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摘 要 : 轨迹 模式 是 航空 器 在 某 段 时 间或 某 个 区 域内 相对 稳定 的 飞行 模式 ， 对 理解 和 判断 目标 在 一 段 时 间或 一 定 区 
域内 的 行为 有 着 重要 的 意义 。 针 对 目标 轨迹 的 特点 ， 在 基于 点 密度 的 聚 类 算法 的 基础 上 ， 设 计 并 实现 了 一 种 基于 线 
段 密 度 的 轨迹 聚 类 方法 。 该 方法 使 用 最 小 描述 长 度 原 则 将 目标 的 历史 轨迹 分 割 为 若干 轨迹 段 ， 通 过 计算 轨迹 段 之 间 
的 相似 度 对 飞行 轨迹 进行 聚 类 ， 最 后 运用 扫描 线 算 法 生成 目标 的 轨迹 模式 。 实 验证 明 ， 该 方法 可 以 较为 准确 地 从 大 
量 轨迹 数据 中 发 据 出 航空 器 目标 的 轨迹 模式 。 
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Research on trajectory pattern mining based on trajectory clustering 
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Abstract: Trajectory mode is a relatively stable flight mode of an aircraft in a certain period of time or a certain area, which 
is of great significance to understand and judge the behavior of the target in a certain period of time or a certain area. 
Aiming at the characteristics of target trajectory, a trajectory clustering method based on line segment density was designed 
and implemented on the basis of point density clustering algorithm. In this method, the historical trajectory of the target was 
divided into several trajectory segments according to the minimum description length principle, and the flight trajectory was 
clustered by calculating the similarity between the trajectory segments. Finally, the trajectory pattern of the target was 
generated by scanning line algorithm. Experiments show that this method can accurately extract the trajectory patterns of 
aircraft targets from a large number of trajectory data. 
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标 历史 轨迹 得 到 目标 运动 规律 的 方法 应 用 到 航空 器 轨迹 模 


ls 式 的 发 所 中 ， 用 以 发 现 隐 臣 在 海量 飞行 轨迹 信息 中 的 航空 器 
人 类 航空 技术 的 进步 推动 了 航空 产业 的 大 发 展 大 繁荣 ， 飞行 特征 与 规律 。 
但 日 益 增多 的 各 类 航空 器 也 带 来 了 巨大 的 监管 难题 。 以 飞机 聚 类 是 目标 轨迹 模式 挖掘 的 过 程 中 常用 的 方法 之 一 。 在 
C= 为 代表 的 各 类 航空 器 在 方便 人 类 的 同时 ， 对 这 些 机 动 灵活 的 众多 的 轨迹 聚 类 方法 中 ， 本 文选 取 了 基于 密度 的 聚 类 方法 
空中 目标 的 监管 也 成 了 一 个 环 手 的 问题 。 虽 然 现 代 社 会 信息 DBSCAN (density-based spatial clustering of application with 
化 水 平 的 提高 和 遥感 探测 技术 的 进步 使 得 人 类 对 航空 器 实时 noise) 四， 并 结合 航空 器 飞行 数据 的 特点 对 经 典 算法 加 以 改 
位 置 的 获取 和 感知 变 得 简单 ， 但 由 于 部 分 航空 器 特别 是 民用 进 ， 实 现 了 一 种 基于 线段 密度 的 航空 器 轨迹 聚 类 算法 。 该 方 
航班 以 外 的 航空 器 飞行 过 程 灵活 多 变 ， 对 其 行为 的 分 析 大 部 法 通过 对 目标 的 历时 飞行 轨迹 数据 进行 聚 类 分 析 ， 从 特定 
分 需要 依靠 管控 人 员 的 知识 与 经 验 , 难以 实现 完全 的 自动 化 。 标的 海量 历史 飞行 数据 中 提取 其 频繁 轨迹 模式 ,在 此 基础 上 ， 
在 飞行 数据 的 规模 不 断 增加 和 数据 的 实时 分 析 处 理 能 力 严重 可 以 充分 挖掘 目标 的 属性 特征 和 行为 特征 ， 进 而 为 实现 包括 


x 


不 足 的 背景 下 ， 如 何 实现 在 海量 信息 中 发 据 目 标的 频繁 轨迹 空中 目标 管控 、 轨 迹 异常 检测 、 热 点 区 域 发 现 等 应 用 打下 坚 
模式 并 掌握 其 飞行 特征 ， 对 实现 包括 航空 器 的 飞行 管控 、 飞 实 的 基础 。 


行 轨迹 检测 与 预警 、 热 点 区 域 发 据 在 内 的 许多 领域 有 着 重要 i 
ee 又 域 发 掘 在 内 的 许多 领域 有 着 重要 1 ”轨迹 数据 
轨迹 挖掘 在 早已 在 气象 、 生 态 等 领域 有 着 广泛 的 应 用 口 。 航空 器 的 轨迹 数据 通常 指 通过 卫星 、 雷 达 或 其 它 传感器 
然 界 中 ， 动 物 的 迁徙 轨迹 、 飓 风 的 移动 轨迹 、 洋 流 的 运动 获得 的 空中 目标 移动 轨迹 数据 。 近 年 来 ， 移 动 通信 技术 和 位 
L 迹 等 往往 具有 一 定 的 规律 性 ， 它 们 的 移动 路 线 在 一 定 程度 感知 技术 的 快速 发 展 使 得 获取 各 类 移动 目标 的 实时 位 置信 


申 

多 

上 反映 了 它们 常见 的 运动 趋势 。 人 类 受到 局 发 ， 将 这 种 发 现 乱 变 得 越 来 越 简单 ， 轨 迹 数 据 的 规模 也 因此 迅速 增长 。 如 何 
纲 律 的 方法 应 用 到 更 多 领域 。 壁 如 在 军事 领域 ， 通 过 分 析 群 在 较 短 时 间 内 从 海量 的 轨迹 数据 中 挖掘 出 需要 的 知识 和 信 
体 目 标 一 段 时 间 内 的 移动 路 线 可 以 得 到 目标 的 活动 规律 ， 进 息 ， 成 为 了 大 数据 时 代数 据 挖掘 领域 的 一 个 新 挑战 。 

而 预测 目标 的 作战 意图 。 同 样 的 道理 ， 可 以 将 这 类 通过 分 析 根据 数据 挖掘 外 的 定义 ， 移 动 轨迹 模式 挖 据 可 以 定义 为 
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Fig.1 Format of track data 
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于 目标 的 轨迹 是 由 一 个 个 按时 间 顺 序 的 点 位 构成 ， 最 简单 特征 变化 大 的 点 位 ， 称 之 为 特征 点 (characteristic point)。 对 于 
的 分 割 方法 就 是 以 每 两 个 相 邻 的 点 之 间 的 线段 作为 轨迹 的 子 轨迹 Ti=pip2p3.…preni; 选取 了 一 系列 特征 点 {pel, pe2, pe3，.…， 
轨迹 。 这 样 分 割 得 到 的 子 轨迹 原则 上 最 能 代表 原始 轨迹 ， 但 pen} 《ci<c2<c3<...<cn) 对 轨迹 全 进行 分 制 ， 分割 后 每 两 个 相 
与 此 同时 也 带 来 一 些 问题 ， 当 点 位 比较 密集 时 会 导致 子 轨迹 邻 的 特征 点 连接 为 一 条 线段 ， 所 以 轨迹 Ti 被 分 割 为 n-l 条 线 
过 短 ， 使 得 发 现 轨 迹 间 的 共性 规律 变 得 更 难 ， 而 且 轨 迹 划 分 段 。 图 3 展示 了 轨迹 分 割 的 过 程 , 其 中 实 线 部 分 是 原始 轨迹 ， 
过 多 会 导致 计算 量 过 大 。 因 此 ， 需 要 找到 一 个 更 加 合适 的 轨 虚线 部 分 是 分 割 后 得 到 的 特征 轨迹 ，p:、p3、Pp; 为 特征 点 。 


迹 分 割 方法 对 原始 轨迹 进行 划分 。 
最 小 描述 长 度 是 信息 论 和 计算 机 科学 中 一 个 重要 概念 ， ps 
简单 来 讲 就 是 用 最 少 的 符号 描述 最 多 的 内 容 ， 符 合 本 文 对 轨 2 
迹 进行 分 割 的 要 求 : 将 一 条 完整 的 轨迹 在 保留 其 特征 的 情况 
下 用 最 少 的 轨迹 段 表示 。 图 3 ”轨迹 分 割 的 过 程 
基于 线段 密度 的 轨迹 聚 类 在 具体 操作 时 分 为 分 割 、 聚 类 Fig.3 The process of trajectory segmentation 
和 重组 三 个 阶段 。 在 分 割 步 又 中 使 用 MDL 原则 对 原始 目标 在 用 以 上 方法 对 轨迹 进行 分 割 的 过 程 中 ， 要 考虑 两 方面 
轨迹 进行 分 段 表 示 ; 在 聚 类 阶段 ， 采 用 基于 密度 的 的 因素 : 准确 和 简明 。 准 确 就 是 要 求 分 割 后 的 轨迹 要 和 原始 


ed 线段 聚 类 算法 09 对 相似 的 目标 轨迹 分 段 进 轨迹 的 差距 尽 可 能 地 小 ; 简明 就 是 要 求 轨迹 分 割 后 的 轨迹 段 


行 聚 类 ， 在 重组 阶段 ， 从 聚 类 得 到 的 轨迹 段 集合 中 生成 目标 数目 应 尽 可 能 地 少 ， 即 要 求 在 对 轨迹 进行 分 割 的 过 程 中 尽 可 
0 能 选取 轨迹 特征 变化 明显 的 点 位 。 但 与 此 同时 ， 特 征 点 位 选 
假设 所 有 n 条 轨迹 位 于 同一 集合 TRA 中 ，TRA={T，， 取 数 量 较 少 的 情况 下 会 使 得 分 割 后 轨迹 的 准确 性 无 法 得 到 保 
T2，T3，...，Tn}。 每 条 轨迹 由 一 系列 多 维 的 数据 点 p 构成 。 证 。 由 于 轨迹 分 割 很 难 同 时 满足 准确 和 简明 两 个 要 求 ， 因 此 
假设 轨迹 Ti 由 leni 个 点 构成 ， 则 轨迹 T={pl，p2，p3，…， 要 在 二 者 之 间 寻 求 一 个 最 佳 的 平衡 ， 最 大 限度 地 满足 准确 和 


pienij, 轨迹 pope.…pek(1<cl<c2<ck<leni) 被 称 为 Ti 的 子 轨迹 。 简明 的 要 求 。 针 对 以 上 要 求 ， 论 文采 用 在 信息 论 中 被 广泛 应 
在 算法 实现 过 程 中 ， 每 条 轨迹 首先 被 分 割 为 一 系列 可 以 代表 用 的 最 小 描述 长 度 MDL) 原则 对 目标 原始 轨迹 进行 分 割 。 
该 条 轨迹 的 轨迹 段 集合 C={C1, C2, .…, Cn}, 其 中 Ci(CO<i<n) 在 MDL 原则 中 ,最 小 长 度 包含 两 部 分 , LID 和 IDIH)。 
为 轨迹 Ti 的 分 割 后 的 线段 。 线 段 pip; (i<j) 是 轨迹 分 割 后 的 其 中 LGD 是 假设 所 占用 的 信息 长 度 , LODIH) 是 在 假设 基础 上 

一 线段 ， 线 段 之 间 的 距离 如 果 小 于 某 一 阔 值 ， 则 会 被 归 到 表示 目标 所 用 信息 长 度 。 在 把 MDL 原则 应 用 到 轨迹 分 割 时 
同一 类 簇 中 。 每 条 轨迹 段 随 着 算法 的 推进 都 会 被 判定 为 核心 LOGD 和 LODI 印 代表 的 内 容 也 有 相应 的 改变 。LGD 代 表 按 照 
线段 、 一 般 线 段 或 噪声 线段 。 最 后 从 聚 类 得 到 的 轨迹 篮 中 提 征 点 对 原始 轨迹 分 割 后 得 到 的 轨迹 段 长 度 之 和 ，LODIH) 代 


表 
取 目 标的 代表 性 轨迹 (representative trajectory) 并 生成 目标 了 原始 轨迹 和 分 割 后 轨迹 段 之 间 的 差异 程度 ， 这 种 差异 程度 
轨迹 模式 。 代 表 性 轨迹 由 一 系列 的 点 位 构成 ， 是 表征 目标 主 通过 距离 函数 来 确定 。 本 文 算法 表示 差异 程度 所 使 用 的 距离 
要 飞行 特征 的 模拟 轨迹 。 完 整 算法 的 伪 代 码 如 下 所 示 。 函数 由 原始 轨迹 和 分 割 后 轨迹 段 之 间 的 三 种 距离 之 和 来 表 
输入 : 目标 原始 轨迹 集合 TRA={T，T，T，:…，T] 示 。 这 三 种 距离 分 别 是 垂直 距离 4, ,角度 距离 d。 和 平行 距离 
输出 :目标 规律 轨迹 集合 d ， 有 具体 定义 及 计算 方法 将 在 下 节 详 细 解 释 。 有 关 LGD 和 
算法 : LODI 配 的 实例 如 图 4 所 示 ， 其 中 pl、p4 为 假设 的 特征 点 。 
stepl P 
foreachTin TRA “@ 
execute sub-trajectory using MDL principle pa 
get a line segment set D by < | 


L(H) = len(pips) 

. . L(DIH) = di(pipapipz) + di(pipap2p3) + di (pipa,papa)+ 
foreach line segment Lin D de(pipa,pip2) + de(pipwpzpa) + de (pipa,papa)+ 
di(pipa,pip2) + di(pipa,pzp3) + di(pipa,paps) 


step2 


execute line segment cluster using DBSCAN 


step3 图 4 L(D 和 LDIED) 的 实例 
execute representative trajectory Fig.4 Examples of L(H) andLODID) 
从 有 关公 式 的 定义 可 以 看 出 ,LGD 代 表 了 分 割 的 简明 性 ， 


4 算法 原理 LDIH) 代 表 了 准确 性 。 在 特征 点 选择 时 ，L(ED 随 着 分 割 的 轨 

针对 航空 器 在 飞行 过 程 中 的 轨迹 特点 ， 论 文 对 在 。” 迹 段 的 数量 增加 而 增 大 ，LDIED 随 着 分 割 后 的 轨迹 偏离 原始 
DBSCAN 算法 的 基础 上 设计 并 实现 了 一 种 基于 线段 密度 的 ”轨迹 的 程度 而 增 大 。 
轨迹 聚 类 算法 。 该 算法 分 为 三 个 阶段 ， 第 一 阶段 使 用 MDL 在 寻找 轨迹 分 割 点 (特征 点 ) 时 ， 为 了 简化 计算 ， 采 用 
原则 对 原始 轨迹 进行 分 割 ， 使 得 分 割 后 的 轨迹 可 以 在 保证 不 局 部 最 优 代 蔡 全 局 最 优 的 方式 对 分 割 点 进行 选择 。 假 设 当 pi 
失真 的 情况 下 尽 可 能 地 简洁 ， 简 化 了 计算 过 程 ， 减 少 了 计算 。 为 特征 点 时 , 用 Las 代表 LHD) 和 IL(DIH) 之 和 ; 当 pi 为 普通 
时 间 和 空间 的 消耗 ， 第 二 阶段 是 设计 并 使 用 了 一 种 基于 组 合 。 数据 点 时 ， Loope 代表 轨迹 的 原始 长 度 。 在 判断 pi 是 否 为 特 
距离 的 线段 相似 度 判 别 函 数 对 轨迹 段 进行 聚 类 ， 把 相似 的 轨 。。 征 点 时 ， 将 La 6 和 Loovr i, 进行 比较 ， 当 Low 6 <Loope 
迹 段 合 并 为 同一 类 能 ， 第 三 阶段 是 从 各 个 轨迹 马 中 生成 代表 时， 可 以 把 pi 作为 分 割 点 。 并 且 当 L(H) 和 LCDIH) 的 和 值 最 


性 轨迹 作为 目标 的 轨迹 模式 。 小 时 ， 轨 迹 分 割 的 效果 最 优 。 算 法 的 伪 代 码 如 下 所 示 。 
4.1 基于 MDL 原则 的 轨迹 分 割 与 表示 输入 : 目标 原始 轨迹 T={pi,p2;p3,p4,…spieni} 

本 节 介 绍 如 何在 尽 可 能 保持 轨迹 原貌 的 前 提 下 对 轨迹 进 输出 : 轨迹 的 分 割 点 集合 C 
行 分 割 。 在 对 轨迹 进行 分 割 时 ， 最 理想 的 状态 就 是 找到 轨迹 算法 : 
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add pi into the C 
start=]1,length=1 
while(starttlength<leni) 
i=start+length 
if (Lpar(Start,i) <Lnopar(start,i)) 
Add pi into C 
startIndex=i 
length=1 
else 
length++ 
add pleni into C 
4.2 基于 组 合 距离 的 相似 度 判别 函数 
在 对 分 割 后 的 轨迹 段 进 行 聚 类 之 前 ， 首 先 对 聚 类 过 
计算 相似 度 用 到 的 几 个 距离 函数 进行 简要 介绍 
距离 的 相似 度 判 别 函数 由 三 个 距离 组 合 得 到 : 导 
了 距离 、 角 度 距离 。 


羽 
瞩 
监 高 


SN 


图 5 垂直 距离 、 平 行距 离 、 


度 距 离 展示 图 


出 
i 
妹 
Eo 
TI 
下 

ul 
Kt 
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Fig.5 Display of vertical distance, parallel distance and angle distance 


如 图 5 所 示 , 假设 有 两 个 d 维 


Si、 ti、 


的 轨迹 线段 Li=siei, Lj=sjej， 
si、gej 分 别 是 两 条 线段 的 首尾 点 ，ps 和 pe 分别 为 sj 和 


ej 在 Li 上 的 投影 点 。1 是 sj 和 ps 之 间 的 欧 氏 距 离 ，] 是 e 和 
pe 之 间 的 欧 氏 距离 , 则 Li 和 Lj 之 间 垂 直 距 离 的 定义 如 式 (1) 


所 示 ; 


段 设 ps 和 pe 分别 为 s; 和 ej 在 Li 上 的 投影 点 ，11 表示 


ps 到 si 的 距离 , > 表示 pe 到 si 的 距离 ， 则 Li 和 LL; 的 平行 距离 
的 定义 如 式 〈2) 所 示 ; 假设 [Li 表示 Li 的 长 度 ，|Lij| 表 示 Li 


的 长 度 ,9 表示 Li 和 Lj 之 间 的 夹 角 ， 可 以 通过 向 量 
算得 到 ， 则 站 和 三 之 间 的 角度 距离 定义 如 式 〈3) 所 示 。 


) 如 4 
Li+h, 


d,(L,L 


J 


dl (4,5) =Min(l,lp) 
allxsin 9,0° < 0 < 90° 
lh90° <0 <180° 


4 二 


的 方式 计 


(1) 


2) 


(3) 


垂直 距离 、 平 行距 离 和 角度 距离 的 定义 与 计算 方法 介绍 


完毕 。 两 条 线段 之 间 相 似 性 的 判别 函数 可 
到 ， 假 设 dist (Li，Li) 表示 Li 和 Lj 之 间 


的 距离 判别 函数 


三 种 距离 组 合 得 


则 其 定义 如 式 〈4) 所 示 。dist (Li，Li) 的 值 越 大 ，Li 和 L; 


的 相似 度 越 低 。 
dist(Ls L)=d (Ls L)+tdi(Ls L)+as(L, L) 
4.3 ”基于 线段 密度 的 轨迹 聚 类 


为 了 描述 方便 ， 除 了 之 前 提 到 的 核心 线段 、 边 界线 段 、 
噪声 线段 外 ， 还 需 引入 三 个 轨迹 聚 类 过 程 中 ) 


(4) 


到 的 定义 。 假 


设 D 代表 所 有 分 割 后 的 轨迹 段 集合 ，Li、Li 代 表 D 中 的 任意 


一 条 轨迹 段 。 


a)e- 邻 域 。 轨 迹 段 在 给 定 距 离 e 以 内 的 区 域 称 为 该 轨迹 段 


的 s- 邻 域 ， 用 符号 表示 为 Ne。 


b) Min7ns。 判 定 轨迹 段 是 否 为 核心 轨迹 的 周围 轨迹 段 数 
量 闵 值 。 如 果 一 个 轨迹 段 的 e- 邻 域内 的 轨迹 段 数量 大 于 或 等 
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于 MinLns， 则 该 轨迹 段 为 核心 轨迹 段 。 
直接 密度 可 达 。 在 集合 D 中 ， 
且 二 为 核心 轨迹 段 ， 那 么 Li 到 二 直接 密度 可 达 。 


Li 在 Lj 的 g- 邻 域内 并 
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dd) 密度 可 达 。 在 集合 D 中 ， 存在 轨迹 段 Li， 工 >， 9 Ln, 
L=LI，LFLa， 如 果 Lx 到 Lel (1<k<n) 直接 密度 可 达 ， 那 


么 轨迹 段 Li 到 密度 可 达 。 

e 密 度 相 连 。 媳 
是 密度 可 达 的 ， 那 么 称 Li 和 Li 密度 相连 。 
基于 线段 密度 的 轨迹 聚 类 算法 的 


A 


在 集合 D 中 ， 如 果 轨 迹 段 Lx 到 Li 和 都 


的 就 是 在 轨迹 集合 D 
中 寻找 密度 相连 轨迹 段 的 最 大 集合 0， 实 现 过 程 中 需要 设置 


三 个 参数 : 邻近 阔 值 s 和 数量 阔 值 MinZLnsy 和 MinLns2。 算 法 


开始 前 ， 所 有 被 分 割 后 的 轨迹 段 被 标记 为 未 识别 的 轨迹 段 ， 
随 着 算法 的 


进 ， 这 些 轨迹 段 都 会 被 标记 为 不 同 的 类 型 ， 划 


分 到 某 一 簇 或 者 被 标记 为 噪声 轨迹 。 为 了 便于 描述 ， 可 将 算 


法 可 以 分 为 三 个 阶段 。 
a) 计 算 每 一 条 未 被 标记 的 


L 迹 段 的 e- 邻 域 。 如 果 轨 迹 段 


L 被 标记 为 核心 轨迹 段 ， 算 法 就 会 执行 第 二 部 分 ， 计 算 并 得 


到 其 e- 邻 域 。 


其 加 入 到 
迹 
六 


断 。 判 定 过 程 中 用 到 参数 MinLns。 
co) 计算 每 个 簇 中 轨迹 段 所 在 原始 轨迹 的 数 
闵 值 MinLns2 则 将 其 过 滤 。 

算法 的 伪 代 码 如 下 所 示 。 


， 如 果 小 于 


b) 计 算 该 区 域内 所 有 轨迹 段 的 直接 密度 可 达 轨 迹 段 并 将 
核心 轨迹 段 所 形成 的 簇 中 。 如 果 一 个 新 加 入 的 轨 
段 未 被 判定 是 否 为 核心 轨迹 , 将 会 被 加 入 到 队列 Q 中 等 待 


输入 : 轨迹 段 集 合 D={Li,L2...Ln}; 参数 es 和 参数 MinLnsi, MinLns2. 


输出 : 轨迹 集合 0={C1,C2...Ca}。 
算法 : 
stepl 
mark all the line segments in D as unclassified 
foreach Lin D 
if (Lis unclassified ) 
compute N:(L) 
if([INe(D)lEMinLnsi) 
assign clusterID to vVX € N:(L) 
insert Ne(L)-{L} into queue Q 
step2 
while(Q#0) 
Compute Ne(M)//M is one of a segment in Q 
if([IN:(MRMinLnsi) 
foreach Yin Ne(M) 
if (Y is unclassified) 
assign clusterID to Y 
else 
mark M as noise 
Remove M from the queue Q 
clusterID ++ 
else 
mark L as noise 
step3 
foreach Cin O 
这 IC|<MinLns> 
Remove C from the set O of clusters 


4.4 “特征 轨迹 生成 


在 对 轨迹 进行 聚 类 过 后 会 得 到 若干 轨迹 艇 ， 算 法 的 最 后 


步 就 是 从 轨迹 簇 中 生成 可 以 代表 总 体 运动 趋势 的 特征 轨 
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迹 。 特 征 轨迹 由 一 系列 的 点 位 组 成 ， 这 些 点 位 通过 扫描 线 算 5.3 ”程序 运行 及 结果 分 析 
法 I 得 到 。 在 这 里 不 再 使 用 平行 距离 因为 在 一 般 情况 下 航空 器 的 原 


习 描 线 算 法 的 流程 如 下 : 对 于 在 算法 上 一 步 中 得 到 的 轨 台 轨迹 和 分 段 后 轨迹 比较 相似 ， 为 了 减少 轨迹 较 长 、 数 据 量 


迹 段 集合 ， 在 轨迹 所 在 的 坐标 系 内 ， 生 成 一 条 和 集合 内 轨迹 较 大 时 计算 量 过 大 的 情况 ， 忽 略 掉 平 行距 离 。 

趋势 垂直 的 线段 ， 称 之 为 扫描 线 ， 通 过 计算 每 条 轨迹 段 和 扫 由 于 实验 数据 是 位 置信 息 数据 ， 为 了 更 直观 地 展示 实验 
描 线 的 交点 个 数 判断 是 否 在 相应 位 置 生成 特征 轨迹 的 点 位 ， 过 程 ， 实 验 环节 采用 了 可 视 化 的 技术 将 数据 根据 其 地 理 位 置 
如 果 相 交 的 点 位 超过 某 一 设 定 好 的 阔 值 ， 那 么 会 计算 这 些 交 在 地 图 上 显示 出 来 。 数 据 可 视 化 过 程 中 ， 论 文 使 用 了 基于 
点 的 坐标 均值 作为 特征 轨迹 点 位 的 坐标 ， 最 后 将 这 些 特征 轨 Python 语言 的 开源 工具 包 Matplotlab 和 Basemap03l。 

迹 点 位 连接 起 来 构成 该 轨迹 集合 的 特征 轨迹 。 算 法 的 最 后 ， 图 7 展示 了 数据 预 处 理 前 后 目标 轨迹 的 示意 图 。 通 过 对 
将 所 有 轨迹 段 集合 的 特征 轨迹 合并 ， 构 成 目标 的 轨迹 模式 。 比 可 以 明显 地 看 出 ， 在 进行 数据 预 处 理 之 前 的 目标 轨迹 中 存 
算法 的 实例 如 图 6 所 示 ， 图 中 黑色 实 线 部 分 是 轨迹 段 集合 ， 在 着 大 量 错误 点 。 图 中 的 错误 点 的 原因 是 由 于 采集 手段 的 不 
虚线 为 扫描 线 ， 扫 描 线 按 箭头 方向 移动 ， 交 点 阔 值 假定 为 3。 同 导致 融合 过 后 的 数据 不 统一 ， 在 数据 预 处 理 过 程 中 对 明显 


经 过 计算 生成 的 特征 点 用 黑色 实心 点 表示 ， 将 这 些 特征 点 相 普 误 的 数据 点 予以 剔除 。 因 此 ， 数 据 预 处 理 步骤 十 分 必要 ， 
连 生成 的 轨迹 作为 集合 的 特征 轨迹 。 否则 会 影响 到 之 后 目标 轨迹 的 聚 类 精度 。 


图 6 特征 轨迹 生成 实例 


Fig.6 Example of feature path generation 图 7 数据 预 处 理 前 后 对 比 图 
5 实时 合 1 广 真 及 针 果 分 刷 折 Fig.7 Comparison before and after data preprocessing 
ee 图 8 展示 了 目标 原始 轨迹 经 过 完整 的 轨迹 聚 类 步骤 之 后 


UU 


本 节 通 过 进行 仿真 实验 验证 算法 的 有 效 性 。 首 先 介绍 了 得 到 的 目标 轨迹 模式 。 从 图 中 可 以 看 出 ， 算 法 成 功 地 从 历 
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实验 环境 和 实验 数据 ， 接 着 把 经 过 预 处 理 后 的 轨迹 数据 和 参 轨迹 中 提取 出 三 条 目标 的 轨迹 模式 。 实 验 得 到 的 结果 经 过 领 
数 作为 输入 进行 运算 ， 最 后 把 得 到 结果 后 将 其 用 可 视 化 的 技 域 专家 人 工 判 证 ， 符 合 领域 的 先 验 知识 ， 较 为 准确 地 刻画 出 
术 呈 现 。 A 型 飞机 的 轨迹 模式 和 活动 规律 ， 达 到 了 实验 预期 效果 ， 证 
5.1 实验 环境 明了 算法 的 合理 性 。 


硬件 环境 : Windows7 操作 系统 , Intel Core-i7 处 理 器 (3.6 


GHz)， 内 存 8 GB。 >» hg 
编译 语言 : Java。 
编译 环境 : Eclipse Neon, JDK 1.8。 [Es 

5.2 ”数据 选择 与 参数 设置 人 


实验 验证 环节 使 用 了 A 型 飞机 〈 注 : 由 于 实验 数据 涉 密 
原因 ， 目 标 名 称 、 目 标 数据 和 实验 结果 在 展示 时 均 进 行 了 处 
理 ) 在 2017 年 第 一 季度 的 飞行 轨迹 数据 。 该 数据 集 包 含 了 


| 


157 条 轨迹 ， 共 23 035 个 数据 点 。 实 验 之 前 ， 已 经 将 数据 进 
行 过 清洗 ， 最 大 限度 地 保证 了 数据 的 完整 性 和 可 靠 性 。 \[ 
实验 过 程 中 需要 对 参数 es、.MinZmnasy 和 MinZnsz 进行 设置 。 图 8 轨迹 聚 类 结果 
在 前 期 程序 设计 过 程 中 的 小 规模 数据 测试 时 发 现 ， 三 个 参数 Fig.8 Track clustering results 


的 取 值 大 小 对 于 实验 结果 有 较 大 的 影响 。 当 s 一 定时 ， 6 结束语 
MinLnsi 的 取 值 和 聚 类 生成 的 轨迹 复数 目的 成 负 相关 ; 当 es 

MinLnsi 一 定时 , 8 的 取 值 和 聚 类 生成 的 轨迹 簇 数 目的 成 正 忆 本 文 设 计 并 实现 了 一 种 基于 线段 密度 的 轨迹 聚 类 方法 用 
关 。MinLnsz 的 大 小 也 会 影响 到 最 后 生成 的 轨迹 复数 目 。 于 航空 器 轨迹 模式 的 发 现 。 该 方法 的 实现 过 程 分 为 原始 轨迹 
于 轨迹 艇 过 多 或 过 少 都 难以 客观 准确 地 得 出 目标 的 特征 轨 分 割 、 轨 迹 段 聚 类 和 特征 轨迹 生成 三 个 阶段 。 在 轨迹 划分 阶 
迹 ， 因 此 在 设置 参数 时 需要 根据 实际 情况 并 结合 经 验 知识 合 段 ,使 用 最 小 描述 长 度 准则 将 目标 的 原始 轨迹 分 割 为 轨迹 段 ; 
理 地 调整 参数 的 大 小 。 轨迹 聚 类 阶段 ， 使 用 改进 的 基于 密度 的 算法 对 划分 后 的 轨迹 
在 基于 密度 的 聚 类 方法 中 对 于 参数 的 优化 算法 有 许多 段 进行 聚 类 ;特征 轨迹 生成 阶段 ， 使 用 扫描 线 算法 提取 出 特 
种 , 论文 选取 了 理解 和 实现 相对 容易 的 比较 误差 平方 和 (Sum 征 轨迹 作为 目标 的 轨迹 模式 。 最 后 ， 通 过 实验 仿真 验证 了 方 
of Squared Error ,SSE) 的 方法 03， 在 保证 误差 平方 和 相对 较 法 的 合理 性 和 实用 性 .除了 用 于 航空 器 轨迹 模式 的 挖掘 之 外 ， 
小 的 情况 下 结合 人 工 经 验 选 取 参 数 ， 使 得 选取 的 参数 在 聚 类 针对 特定 领域 进行 相应 改进 ， 该 方法 在 海 空 目标 的 管控 、 目 
过 程 中 生成 最 能 代表 目标 飞行 模式 的 特征 轨迹 。 通 过 多 次 试 标的 轨迹 预测 、 热 点 区 域 的 发 现 等 方面 同样 具有 重要 的 意义 
验 和 优化 ， 最 终 确定 s 的 取 值 为 0.45，MinLns: 和 MinLns2 和 价值 。 下 一 步 的 工作 将 致力 于 针对 不 同情 况 下 算法 参数 的 
的 取 值 为 均 为 10。 优化 和 通过 运动 趋势 对 目标 的 轨迹 进行 预测 。 
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